Conditional Probability: Counterintuitive problems

Conditional Probability and Bayes’ Theorem

আমাদের খুব পরিচিত একটি এক্সপেরিমেন্ট নিয়ে ভাবা যাক। ধর আমরা একটি ছক্কা রোল করেছি এবং জানতে চাচ্ছি $3$ আসার সম্ভাবনা কত (ধরে নাও ছক্কায় যেকোনো সংখ্যা আসার সম্ভাবনা সমান)? উত্তর নিশ্চয়ই $\frac{1}{6}$ ; এখানে একটি ফেয়ার ছক্কা রোল করা হয়েছে বাদে এক্সপেরিমেন্ট সম্পর্কে কোনো অতিরিক্ত তথ্য ছিল না আমাদের কাছে। কিন্তু কেও যদি আমাদের বলে রোলটিতে একটি বিজোড় সংখ্যা এসেছে, তাহলে কিন্তু $3$ আসার সম্ভাবনা $\frac{1}{6}$ থেকে বেড়ে $\frac{1}{3}$ হয়ে যাবে। অর্থাৎ আমরা যখন এক্সপেরিমেন্ট সম্পর্কে অতিরিক্ত তথ্য পাই তখন কোনো ইভেন্ট ঘটার সম্ভাবনাও পরিবর্তিত হয়ে যায়। যেমন “বাংলাদেশের ভারতকে ক্রিকেট ম্যাচে হারানোর সম্ভাবনা” আর “বাংলাদেশের ভারতকে ক্রিকেট ম্যাচে হারানোর সম্ভাবনা যখন ম্যাচ মিরপুরে হবে” একই কথা নয়- ভেন্যু সম্পর্কে এই অতিরিক্ত তথ্য আমাদের ম্যাচ জিতার সম্ভাবনা বাড়িয়ে দিচ্ছে!

যদি দুটো ইভেন্ট $A$ এবং $B$ হয়, তবে " $B$ ঘটলে $A$ ঘটার সম্ভাবনা" অর্থাৎ "Probability of $A$ given $B$ " কে $P(A\mid B)$ দ্বারা প্রকাশ করা হয়। যেমন আগের উদাহরণে $A =$ ছক্কায় $3$ আসা ও $B=$ ছক্কায় বিজোড় সংখ্যা আসা ধরলে $P(A) = \frac{1}{6}, P(B) = \frac{1}{2},$ কিন্তু $P(A\mid B) = \frac{1}{3}$ । তবে $P(A\mid B)$ বের করার কি সহজ কোনো উপায় আছে?

লক্ষ্য কর, $A$ এবং $B$ উভয়ই ঘটার সম্ভাবনা, অর্থাৎ $P(A\cap B)$ , হচ্ছে $B$ ঘটার সম্ভাবনা, অর্থাৎ $P(B)$ , এবং $B$ ঘটলে $A$ ঘটার সম্ভাবনা, অর্থাৎ $P(A \mid B)$ , এর গুণফল: $P(A \cap B) = P(B) \times P(A \mid B)$ । কাজেই,
$P(A\mid B)= \frac{P(A\cap B)}{P(B)}$
এটি অন্যভাবেও ভাবতে পারো, মনে কর sample space $\Omega$ একটি $1$ ক্ষেত্রফল বিশিষ্ট একটি চতুর্ভুজ। তাহলে $P(A)$ আর $P(B)$ হচ্ছে যথাক্রমে $A$ আর $B$ বৃত্তটির ক্ষেত্রফল।

কিন্তু যখন বলে দেয়া হয়

B

ঘটে গিয়েছে, তার মানে আসলে

B

বৃত্তটির বাইরের সব কিছু irrelevent। অর্থাৎ আমাদের নতুন sample space ই

B

, তাই এখন

A

ঘটার সম্ভাবনা শুধু

(A\cap B)

অংশটি। তাই

B

ঘটার পর

A

ঘটার সম্ভাবনা হবে

(A\cap B)

অংশটি

B

বৃত্তের ক্ষেত্রফলের যত ভাগ ঠিক তত! কাজেই আমরা পাচ্ছি

P(A\mid B) = \frac{P(A\cap B)}{P(B)}

.
আবার একই ভাবে,

A

ও

B

উভয়েরই ঘটার সম্ভাবনা, অর্থাৎ

P(A\cap B)

A

ঘটার সম্ভাবনা

P(A)

এবং

A

ঘটলে

B

ঘটার সম্ভাবনা, অর্থাৎ

P(B\mid A)

, এর গুণফলের সমান! কাজেই

P(A\cap B) = P(A) \times P(B \mid A)

. তাহলে আমরা লিখতে পারি,

P(A\mid B) = \frac{P(A) \times P(B\mid A)}{P(B)}

এটি ই Bayes’ Theorem! এখানে

P(A)

কে বলা হয় “prior probability”,

P(A\mid B)

কে বলা হয় “posterior probability” এবং

\frac{P(B\mid A)}{P(B)}

হচ্ছে “likelihood ratio”.

Some counterintuitive (and super interesting) problems

Problem 1.1. এক ব্যাক্তির দুই সন্তান, যার একটি ছেলে। উনার দুই সন্তান ই ছেলে হওয়ার সম্ভাবনা কত? (কোনো সন্তান ছেলে বা মেয়ে হওয়ার সম্ভাবনা সমান ধরে নাও)

শুরুতে মনে হতে পারে আমরা জানি এক সন্তান ছেলে, তাহলে অপর সন্তানও যেহেতু ছেলে বা মেয়ে হতে পারে, আর উভয় ক্ষেত্রেই সম্ভাবনা সমান, তাই অপর সন্তান ছেলে হওয়ার সম্ভাবনাও $\frac{1}{2}$ , কিন্তু তা সত্য নয়। দুটো ইভেন্ট ডিফাইন করা যাক-
$\begin{align*} A& = \text{উভয় সন্তান ছেলে} \\ B &= \text{সর্বনিম্ন একটি সন্তান ছেলে} \end{align*}$
আমাদের দরকার $P(A\mid B)$ । লক্ষ্য কর $P(A)=\frac{1}{4}$ , $P(B)=\frac{3}{4}$ (কারণ $B$ ঘটবে না শুধু যখন উভয় সন্তান ই মেয়ে হবে, যার সম্ভাবনা $\frac{1}{4}$ ), আর $P(B\mid A)=1$ (কারণ $A$ ঘটলে $B$ সবসময় সত্য)। কাজেই $P(A \mid B) = \frac{P(A) \times P(B\mid A)}{P(B)} = \frac{\frac{1}{4}\times 1}{\frac{3}{4}} = \frac{1}{3}$ ।

এটি আসলে আমরা এত কিছু না করে sample space এর দিকে তাকালেই পারতাম। লক্ষ্য কর, একজন সন্তান ছেলে হয়ে গেলে আমাদের sample space থেকে উভয় সন্তান মেয়ে ইভেন্টটি বাদ পরে যাচ্ছে, ফলে তা দ্বারাচ্ছে $\Omega = \{ BB, BG, GB\}$ । ফলে $BB$ ঘটার সম্ভাবনা থাকছে $\frac{1}{3}$ ।

Problem 1.2. এক ব্যাক্তির দুই সন্তান, যার একটি ছেলে এবং সে শুক্রবারে জন্মেছিলো। উনার দুই সন্তানই ছেলে হওয়ার সম্ভাবনা কত?

সমস্যাটা দেখেই মনে হতে পারে এর সাথে আগের সমস্যার কোনো পার্থক্য নেই, তাহলে নিশ্চয়ই উত্তর ও আগের মত $\frac{1}{3}$ , কেনোনা সন্তান সপ্তাহের কোন দিন জন্মেছে তাতে কিছু যায় আসার কথা না। কিন্তু তা সত্য নয়, মজার ব্যাপার হচ্ছে এবার উত্তর $\frac{1}{3}$ থেকে অনেক বেশি! আবার আগের মতো ইভেন্ট ডিফাইন করা যাক-
$\begin{align*} A& = \text{উভয় সন্তান ছেলে} \\ B &= \text{একটি সন্তান ছেলে যার জন্ম শুক্রবারে} \end{align*}$
সবার আগে লক্ষ্য করতে পারো এবার কিন্তু আগের মতো $P(B\mid A)$ এর মান $1$ নয়, কেনোনা উভয় সন্তান ছেলে হলেও এর মধ্যে একজনের জন্ম শুক্রবারে তা নিশ্চিত করা যায় না। আমরা প্রতি সন্তানকে সে ছেলে নাকি মেয়ে আর সে সপ্তাহের কোন দিন জন্মেছে তার ভিত্তিতে একটি পেয়ার হিসেবে প্রকাশ করতে পারি। এরকম পেয়ার থাকতে পারে $(2 \times 7)^2 = 196$ টি। কাজেই এবার sample space এর সাইজ $|\Omega| = 196$ । আবার উভয় সন্তান ছেলে হলে তারা সপ্তাহের কোন দিন জন্মেছে তা নির্বাচন করার উপায় থাকে $7\times7=49$ টা, কাজেই $P(A) = \frac{49}{196}=\frac{1}{4}$ । $P(B\mid A)$ বের করতে আমরা এর কমপ্লিমেন্ট, অর্থাৎ $P(B^c\mid A)$ বের করে $1$ থেকে বিয়োগ করে দিতে পারি; $P(B^c\mid A)$ মানে হচ্ছে দুই ছেলের কেওই শুক্রবারে জন্মায় নি, তাহলে আমাদের হাতে দিন বাকি থাকল $6$ টি, কাজেই $P(B^c\mid A) = \frac{6\times 6}{49} = \frac{36}{49}$ , কাজেই $P(B\mid A) = (1 - \frac{36}{49}) = \frac{13}{49}$ । একই ভাবে $P(B)$ থেকে $P(B^c)$ বের করা সহজ: যেহেতু $B^c$ মানে কোনো ছেলে সন্তান শুক্রবারে জন্মাতে পারবে না, তাই সন্তান ছেলে নাকি মেয়ে আর সপ্তাহের কোন দিন জন্মালো এই পেয়ার নির্বাচন করার উপায় থাকলো $(2 \times 7 - 1) = 13$ টি, কাজেই $P(B^c\mid A) = \frac{13 \times 13}{196} = \frac{169}{196}$ । সুতরাং $P(B) = (1 - \frac{169}{196}) = \frac{27}{196}$ . কাজেই $P(A\mid B) = \frac{P(A)\times P(B\mid A)}{P(B)} = \frac{\frac{1}{4} \times \frac{13}{49}}{\frac{27}{196}}=\frac{13}{27}$ , যা $\frac{1}{2}$ এর খুব কাছাকাছি!

Problem 2. (Bertrand’s Box Paradox) তোমার সামনে $3$ টি বক্স আছে, এর মধ্যে একটি বক্সে ২টি গোল্ড কয়েন, আরেকটিতে ২টি সিলভার কয়েন, আর অন্যটিতে $1$ টি গোল্ড কয়েন আর একটি সিলভার কয়েন আছে। তুমি randomly একটি বক্স নির্বাচন করে তার থেকে randomly একটি কয়েন নিয়ে দেখলে সেটি গোল্ড কয়েন (তুমি অপর কয়েনটি দেখতে পারছো না)। তবে তোমার নির্বাচন করা বক্সটিতে দুটো গোল্ড কয়েন থাকার সম্ভাবনা কত?

তুমি হয়তো ভাববে যেহেতু নির্বাচন করা বক্সটিতে একটি গোল্ড কয়েন আমরা পেয়ে গেছি, তাহলে দুটো সিলভার কয়েনের বক্সটি আমরা চিন্তা থেকে বাদ দিয়ে দিতে পারি, কাজেই দুটো বক্স আছে এবং এর মধ্যে দুটো গোল্ড কয়েনসহ বক্স একটি, তাই উত্তর হবে $\frac{1}{2}$ । কিন্তু সেটি ঠিক নয়।
সুবিধার জন্য আমরা দুটো গোল্ডের বক্সকে $GG$ , দুটো সিলভার কয়েনের বক্সকে $SS$ এবং একটি গোল্ড আর একটি সিলভার কয়েনের বক্সকে $GS$ দিয়ে প্রকাশ করি। আর শুরুতে একটি গোল্ড কয়েন আর সিলভার কয়েন পিক করার ইভেন্টকে যথাক্রমে $g$ আর $s$ ধরি।

আমরা জানতে চাই $P(GG\mid g)$ এর মান। লক্ষ্য কর $P(GG)=\frac{1}{3}$ এবং $P(g \mid GG)= 1$ , কেনোনা গোল্ড কয়েনের বক্স নির্বাচন করলে সবসময়ই আমরা গোল্ড কয়েন পাবো। $P(g)$ বের করতে আমরা $3$ টা কেসে ভাগ করতে পারি: শুরুতে $GG$ নির্বাচন করলে (যার সম্ভাবনা $\frac{1}{3}$ ) সবসময় একটি গোল্ড কয়েন পাবো (অর্থাৎ সম্ভাবনা $1$ ), আর $SS$ নির্বাচন করলে (যার সম্ভাবনা $\frac{1}{3}$ ) গোল্ড কয়েন পাওয়ার সম্ভাবনা $0$ , আর $GS$ নির্বাচন করলে (যার সম্ভাবনা $\frac{1}{3}$ ) গোল্ড কয়েন পাওয়ার সম্ভাবনা $\frac{1}{2}$ , কাজেই $P(g) = \frac{1}{3} \times 1 + \frac{1}{3} \times 0 + \frac{1}{3} \times \frac{1}{2} =\frac{1}{2}$ । কাজেই,
$P(GG\mid g) = \frac{P(GG)\times P(g\mid GG)}{P(g)}=\frac{\frac{1}{3}\times 1}{\frac{1}{2}}=\frac{2}{3}$
কাজেই তোমার নির্বাচন করা বক্সে দুটো কয়েনই গোল্ড হওয়ার সম্ভাবনা $\frac{2}{3}$ । এটি এভাবেও ভাবতে পারো- একটি কয়েন গোল্ড পাওয়া মানে সেটি দুটো গোল্ড কয়েনের বক্সের যেকোনো একটি হতে পারে (এখানে ২টি অপশন), কিংবা একটি সিলভার ও একটি গোল্ড কয়েনের বক্সের গোল্ড কয়েনটি হতে পারে (এখানে ১টি অপশন)। আর যেহেতু শুরুতে এর যেকোনো একটি কয়েন নির্বাচন করার সম্ভাবনা সমান, আর এই তিন ক্ষেত্রের দুই ক্ষেত্রেই আমরা দুটো গোল্ড কয়েনের বক্স নির্বাচন করছি, তাই এর সম্ভাবনা $\frac{2}{3}$ ।

Problem 3. (The Medical Test Paradox) তোমার দেশে একটি নতুন রোগের আবির্ভাব ঘটেছে, যেটি গড়ে প্রতি $1000$ জনে $1$ জনের হচ্ছে। এই রোগটি নির্নয়ের জন্য যে টেস্ট করা হয়, সেটি $99\%$ সময় সঠিক ভাবে নির্নয় করতে পারে। অর্থাৎ যদি কারো সত্যিই রোগটি হয়ে থাকে, তাহলে এই টেস্ট গড়ে $99\%$ সময়ই positive রিপোর্ট দেয়, এবং বাকি $1\%$ সময় false positive রিপোর্ট দেয় তুমি রোগটির জন্য টেস্ট করিয়ে দেখলে রিপোর্ট positive, তবে তোমার সত্যিই রোগটি হওয়ার সম্ভাবনা কত? (ধরে নাও তোমার কাছে টেস্টটির রিপোর্ট বাদে রোগ সংক্রান্ত কোনো তথ্য নেই, এবং এই রোগের কোনো symptom ও হয় না)

এটি Conditional Probability এর আমার খুব পছন্দের সমস্যা। সমস্যাটা দেখে শুরুতেই intuition বলে যেহেতু টেস্টটি $99\%$ accurate, তাহলে নিশ্চয়ই তোমার রোগটি সত্যিই হওয়ার সম্ভাবনা $99\%$ (after all, false positive রেট মাত্র $1\%$ !)। কিন্তু সেটা সত্য নয়! শুরুতে কিছু event ডিফাইন করা যাক-
$\begin{align*} A& = \text{You are sick} \\ B &= \text{Test report says you are sick} \end{align*}$
যদি আমাদের কাছে কোনো prior ইনফর্মেশন (এক্ষেত্রে টেস্ট রিপোর্ট) না থাকে, তাহলে তোমার রোগ হওয়ার সম্ভাবনা $P(A)$ কত? যেহেতু রোগটি গড়ে $1000$ জনে একজনের হচ্ছে, তাই বলতে পারি prior ইনফর্মেশন ছাড়া $P(A) = \frac{1}{1000}$ । টেস্ট রিপোর্টের accuracy (উপরে যেভাবে ডিফাইন করা হয়েছে তা অনুযায়ী) $99\%$ থেকে আমরা কী বুঝছি? এটি বলছে “তোমার রোগটি হয়ে থাকলে টেস্টে ধরা পড়ার সম্ভাবনা”, অর্থাৎ “Probability of being tested positive given that you are sick”, কিংবা "Probability of $B$ given $A$ " বা $P(B\mid A)$ ; কাজেই $P(B\mid A) = \frac{99}{100}$ । আর আমরা জানতে চাচ্ছি “Probability of being sick given that the test reports you are sick”, অর্থাৎ $P(A \mid B)$ - সেটি কিন্তু $99\%$ নয়!
এবার আমরা যদি $P(B)$ এর মান জানি তাহলেই Bayes’ Theorem কাজে লাগিয়ে $P(A\mid B)$ এর মান বের করে ফেলতে পারবো! টেস্ট রিপোর্ট পজিটিভ আসার সম্ভাবনা $P(B)$ কে আমরা আসলে দুটি আলাদা কেসে ভাগ করতে পারি-

টেস্টকারীর রোগটি হয়েছে: রোগ হওয়ার সম্ভাবনা $P(A)$ এবং রোগ হলে টেস্ট পজিটিভ আসার সম্ভাবনা $P(B \mid A)$ ; কাজেই উভয়ই ঘটার সম্ভাবনা = $P(A) \times P(B \mid A) = \frac{1}{1000} \times \frac{99}{100}$ .
টেস্টকারীর রোগটি হয়নি: রোগ না হওয়ার সম্ভাবনা $(1- P(A))$ এবং রোগ না হলে টেস্ট পজিটিভ আসার সম্ভাবনা, অর্থাৎ False Positive রেট = $\frac{1}{100}$ , কাজেই উভয়ই ঘটার সম্ভাবনা = $(1 - P(A)) \times \frac{1}{100} = \frac{999}{1000} \times \frac{1}{100}.$

কাজেই আমরা পাচ্ছি, $P(B) = \frac{1}{1000} \times \frac{99}{100} + \frac{999}{1000} \times \frac{1}{100} = \frac{1098}{100000}$ । এবার আমরা $P(A\mid B)$ বের করতে পারবো!
$P(A\mid B) = \frac{P(A)\times P(B\mid A)}{P(B)} = \frac{\frac{1}{1000} \times \frac{99}{100}}{\frac{1098}{100000}} = \frac{11}{122} \approx 9\%$
তারমানে টেস্টে পজিটিভ আসার পর ও রোগ না হওয়ার সম্ভাবনা প্রায় $91\%$ ! টেস্টটি এতোটা নিখুঁত হওয়া সত্ত্বেও তোমার রোগটি হওয়ার সম্ভাবনা আসলে খুবই কম! বিষয়টি মেনে নিতে কষ্ট হলে $100,000$ জনের একটি sample নিয়ে ভাবতে পার। গড়ে প্রতি হাজারে যেহেতু একজনের রোগটি হচ্ছে, তাই এখানে রোগ হবে $100$ জনের। কিন্তু যেহেতু টেস্টটি $99\%$ নিখুঁত, তাই এতে $99$ জনের টেস্ট পজিটিভ আসবে, আর $1$ জনের টেস্ট false নেগেটিভ আসবে। আবার যেহেতু টেস্টের false positive রেট $1\%$ , তাই বাকি $(100,000 -100) \times 1\% = 999$ জন মানুষ false positive পাবে! কাজেই টেস্টে পজিটিভ রিপোর্ট পাওয়া মোট মানুষের সংখ্যা দ্বারাচ্ছে $(99+999) = 1098$ জন, আর এর মধ্যে রোগাক্রান্ত মাত্র $99$ জন! কাজেই তোমার রোগ হওয়ার সম্ভাবনা মাত্র $\frac{99}{1098} = 0.0902$ , যা অনেক কম!

Problem 4. (The Monty Hall Problem) তুমি একটি game show তে আছো, তোমার সামনে তিনটি দরজা আছে। দরজা তিনটির একটির পিছনে রয়েছে গাড়ি, আর বাকি দুটির পিছনে রয়েছে একটি করে ছাগল। হোস্ট আগে থেকে জানে কোন দরজার পিছনে কি রয়েছে। তুমি প্রথমে একটি দরজা নির্বাচন করলে; হোস্ট যেহেতু জানে কোন দরজার পিছনে কি আছে, সে একটি দরজা খুলে দেখালো যার পিছনে ছাগল আছে। তারপর সে তোমাকে জিজ্ঞাসা করল এবার বাকি দুটো দরজার মধ্যে তুমি প্রথমে যেই দরজা নির্বাচন করেছ সেটি ই রাখতে চাও, নাকি switch করে অপর দরজাটা নির্বাচন করতে চাও। কি করলে তোমার গাড়ি জিতার সম্ভাবনা বেশি হবে?

তুমি নিশ্চয়ই ভাবছো যেহেতু হোস্ট একটি দরজা খুলে দিয়েছে যার পিছনে ছাগল ছিল, তাহলে বাকি দুটো দরজার একটির পিছনে গাড়ি আর অন্যটির পিছনে ছাগল থাকায় তুমি প্রথমে যেই দরজা নির্বাচন করেছো তার পিছনে গাড়ি থাকার সম্ভাবনা $\frac{1}{2}$ এবং অন্যটির পিছনেও গাড়ি থাকার সম্ভাবনা $\frac{1}{2}$ , কাজেই শুরুতে যেটি নির্বাচন করেছো সেটিতে থাকা কিংবা দরজা পরিবর্তন করা উভয় ক্ষেত্রেই জিতার সম্ভাবনা সমান হওয়া উচিত। কিন্তু সেটা সত্য নয়, তুমি সুইচ করে যদি অন্য দরজাটি নির্বাচন কর তাহলে তোমার গাড়ি জিতার সম্ভাবনা দ্বিগুণ হয়ে যাবে!

তুমি শুরুতে যেই দরজাটি নির্বাচন করেছো সেটির পিছনে গাড়ি থাকার সম্ভাবনা $\frac{1}{3}$ , এবং বাকি দুটো দরজার যেকোনো একটির পিছনে গাড়ি থাকার সম্ভাবনা $\frac{2}{3}$ । এখন লক্ষ্য কর, হোস্ট কিন্তু আগে থেকে জানে কোন দরজার পিছনে কি আছে, তাই সে ইচ্ছা করেই এমন দরজা খুলবে যার পিছনে ছাগল আছে। তুমি যদি প্রথমে ভুল দরজা নির্বাচন করে থাক (যার সম্ভাবনা $\frac{2}{3}$ ), আর বাকি দুটো দরজাকে $X$ আর $Y$ দিয়ে মার্ক করলে, হোস্ট কিন্তু $X$ দরজা খুলবে যদি $Y$ এর পিছনে গাড়ি থাকে, আর $Y$ দরজা খুলবে যদি $X$ এর পিছনে গাড়ি থাকে। কাজেই তুমি যদি সুইচ না করে শুরুর দরজাই নির্বাচন কর, তাহলে তুমি তখন ই জিতবে যখন তুমি শুরুতেই সঠিক ভাবে বের করতে পারবে কোন দরজার পিছনে গাড়ি রয়েছে, যার সম্ভাবনা $\frac{1}{3}$ , আর তুমি যদি শুরুতে ভুল দরজা নির্বাচন করে থাক, যার সম্ভাবনা $\frac{2}{3}$ , সেসকল ক্ষেত্রে কিন্তু সুইচ করলে তুমি জিতে যাচ্ছ! কাজেই যেহেতু শুরুতে ভুল করার সম্ভাবনা বেশি, তাই সুইচ করলেই তোমার জিতার সম্ভাবনা বেশি ( $\frac{1}{3}$ থেকে বেড়ে $\frac{2}{3}$ )!

এখনো মেনে নিতে কষ্ট হলে ধরে নাও তোমার সামনে তিনটার বদলে $100$ টি দরজা আছে, আর $99$ টার পিছনে ছাগল এবং একটির পিছনে গাড়ি আছে। তুমি একটি দরজা নির্বাচন করবে, আর হোস্ট বাকি $99$ টি থেকে $98$ টি দরজা খুলে দেখাবে যার পিছনে ছাগল আছে। এবার ফিল করা সহজ যে সবসময় আমাদের সুইচ করা উচিত। কেনোনা $100$ টি দরজা থেকে শুরুতে ঠিকঠাক যে দরজার পিছনে গাড়ি আছে তা খুঁজে বের করার সম্ভাবনা অনেক কম, মাত্র $\frac{1}{100}$ , অন্যদিকে বাকি $99$ টির মধ্যে একটিতে গাড়ি থাকার সম্ভাবনা অনেক বেশি ( $\frac{99}{100}$ )। হোস্ট যখন সেই $99$ টার মধ্যের কোন $98$ টি দরজার পিছনে ছাগল আছে তা বলে দিচ্ছে, এতে করে তোমার শুরুতে সঠিকভাবে নির্বাচন করার সম্ভাবনা বেড়ে যাচ্ছে না, বরং বাকি যেই $99$ টা দরজা ছিল তার মধ্যে একটিতে গাড়ি থাকার সম্ভাবনার পুরোটাই একটি দরজার মধ্যে পুঞ্জিভূত তা বুঝা যাচ্ছে!